Analyse et expansion des textes en question-réponse
نویسنده
چکیده
This paper presents an original methodology to consider question answering. We noticed that query expansion is often incorrect because of a bad understanding of the question. But the automatic good understanding of an utterance is linked to the context length, and the question are often short. This methodology proposes to analyse the documents and to construct an informative structure from the results of the analysis and from a semantic text expansion. The linguistic analysis identifies words (tokenization and morphological analysis), links between words (syntactic analysis) and word sense (semantic disambiguation). The text expansion adds to each word the synonyms matching its sense and replaces the words in the utterances by derivatives, modifying the syntactic schema if necessary. In this way, whatever enrichment may be, the text keeps the same meaning, but each piece of information matches many realisations. The questioning method consists in constructing a local informative structure without enrichment, and matches it with the documentary structure. If a sentence in the informative structure matches the question structure, this sentence is the answer to the question. Résumé Cet article présente une méthode originale d’envisager la tâche de question-réponse. Nous avons remarqué que l’expansion de requête est souvent erronée du fait d’une mécompréhension de la question. Mais la bonne compréhension d’un énoncé est fonction de la taille du contexte, et les question sont souvent courtes. Notre approche propose d’analyser les documents et de construire une structure informationnelle en utilisant les résultats de l’analyse ainsi que l’enrichissement sémantique des textes. Une analyse linguistique identifie les mots (segmentation et analyse morphologique), les liens entre les mots (analyse syntaxique) et le sens des mots (désambigüısation sémantique lexicale). L’expansion de texte adjoint à chaque mot les synonymes qui correspondent à son acception contextuelle et remplacent les mots des énoncés par leurs dérivés, modifiant si nécessaire la structure syntaxique de la phrase. De la sorte, quel que soit l’enrichissement utilisé, le texte conserve la même signification, tandis que chaque élément d’information obtient de nombreuses actualisations. La procédure d’interrogation consiste à construire une structure informationnelle locale à la question sans effectuer d’enrichissement, et à faire lui faire correspondre un ou plusieurs fragments de la structure documentaire. Si une phrase de la structure informationnelle documentaire correspond à celle de la question, cette phrase contient la réponse à la question.
منابع مشابه
Validation du type de la réponse dans un système de questions réponses
RÉSUMÉ. Dans le cadre de la recherche de réponse à une question posée en langue naturelle dans des textes, de nombreuses questions attendent une réponse d’un certain type. Par exemple la question « Quel président succéda à Jacques Chirac ? » attend en réponse une entité du type président. La méthode présentée dans cet article vérifie que la réponse renvoyée est du bien type cherché. Pour cela e...
متن کاملExtraction automatique de connaissances pour la décision multicritère. (Automatic Knowledge Extraction pour Multicriteria Decision Making)
Cette application, sans prendre parti, aborde le sujet délicat qu’est l’automatisation cognitive. Elle propose la mise en place d’une chaîne informatique complète pour supporter chacune des étapes de la décision, en particulier la phase d’apprentissage en faisant de la connaissance actionnable (CA) une entité informatique manipulable par des algorithmes. La connaissance est extraite directement...
متن کاملEvaluation de la Performance de la Classification d'un Système Question/Réponse
RÉSUMÉ. La plupart des systèmes question/réponse se basent sur trois axes principaux : classification et analyse de la question, recherche de document pertinents et extraction de la réponse. La performance à chaque étape affecte le résultat final. La classification de question apparaît comme une tâche importante car elle infère le type de réponse attendu. Dans cet article, nous présentons des m...
متن کاملCombinaison de fonctions de préférence par boosting pour la recherche de passages dans les systèmes de question/réponse
Résumé. Nous proposons une méthode d’apprentissage automatique pour la sélection de passages susceptibles de contenir la réponse à une question dans les systèmes de Question-Réponse (QR). Les systèmes de RI ad hoc ne sont pas adaptés à cette tâche car les passages recherchés ne doivent pas uniquement traiter du même sujet que la question mais en plus contenir sa réponse. Pour traiter ce problèm...
متن کاملDéfi EGC 2016 : Analyse par Motifs Fréquents et Topic Modeling
Résumé. Dans le domaine de l’analyse de textes, l’extraction de motifs est une technique très populaire pour mettre en évidence des relations fréquentes entre les mots. De même, les techniques de topic modeling ont largement fait leurs preuves lorsqu’il s’agit de classer automatiquement des ensembles de textes partageant des thématiques similaires. Ainsi, ce papier a pour ambition de montrer l’...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید
ثبت ناماگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید
ورودعنوان ژورنال:
- CoRR
دوره abs/cs/0506047 شماره
صفحات -
تاریخ انتشار 2004